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珍稀 濒危 植物 越南 小 花 金 花茶 的 叶绿体 基因 组 特征 分 析 


邓 永 彪 ， 张 进 ， 蓝 伦 礼 ， 赵 博 * 

(桂林 医学 院 药学 院 生 药 学 教研 室 ， 广 西 桂林 541199) 
摘要 : 越南 小 花 金 花茶 (Camellia minima) 是 一 种 珍稀 濒危 的 金 花茶 组 植物 ， 目 前 尚未 有 其 
叶绿体 基因 组 的 相关 研究 。 该 研究 利用 Humina HiSeq 2000 平台 对 越南 小 花 金 花茶 进行 了 叶 
绿 体 基因 组 序列 的 测序 、 组 装 、 注 释 和 分 析 。 结 果 表 明 : (1) ea 叶绿体 基因 组 
全 长 156 961 bp， 为 典型 的 四 分 体 结构 ， 共 注释 到 136 个 基因 ， 其 中 包含 87 个 蛋白 编码 
基因 ，41 个 tRNA 基因 和 8 个 rRNA 基因 。(2) 分 析 鉴 定 出 66 个 SSR inn 39 个 重复 序 
5j. (3) 密码 子 偏好 使 用 以 AU 结尾 的 密码 子 ， 综 合 ENC 绘图 、PR2-plot 和 中 性 分 析 推 测 
然 选 择 是 影响 密码 子 使 用 模式 的 主导 因素 。(4) 边界 分 析 显示 ycfl 基因 的 长 度 和 位 置 在 不 
司 金 花茶 组 植物 间 存 在 差异 。(5) 对 已 发 表 的 金 花茶 组 植物 叶绿体 基因 组 的 系统 发 育 分 析 发 
现 越南 小 花 金 花茶 与 小 花 金 花茶 聚 为 一 支 ， 亲 缘 关 系 很 近 。 该 研究 结果 为 探索 物种 进化 和 
提高 外 源 基因 表达 提供 了 重要 的 参考 信息 ， 同 时 为 后 续 的 金 花茶 组 植物 的 保护 和 利用 提供 
了 理论 基础 。 
关键 词 : 越南 小花 金 花茶 ， 叶 绿 体 基因 组 ， 特 征 分 析 ， 系 统 发 育 分 析 ， 密 码 子 偏好 性 
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Analysis of chloroplast genome features of endangered and 


rare plant Camellia minima 


DENG Yongbiao, ZHANG Jin, LAN Lunli, ZHAO Bo* 
(Department of Pharmacognosy, Pharmacy School, Guilin Medical University, 
Guilin 541199, Guangxi, China) 
Abstract: Camellia minima, a rare and endangered species of Sect. Chrysantha, has not been 
previously explored in terms of its chloroplast genome. Utilizing the Illumina HiSeq 2000 
platform, the chloroplast genome sequence of C. minima was sequenced, assembled, annotated, 
and analysed, The results showed that: (1) The chloroplast genome of C. minima was 156 961 
bp in length, embodies a typical tetrad structure, and contains 136 annotated genes, including 87 
protein-coding genes, 41 tRNA genes, and 8 rRNA genes. (2) The analysis identified 66 SSR loci 
and 39 repetitive sequences. (3) Codons prefer to use codons ending in A/U. Comprehensive ENC 
mapping, PR2-plot, and neutral analyses suggest natural selection as a primary factor shaping 
codon usage patterns. (4) Boundary analysis indicated variation in the length and position of the 
ycfl gene among different species of yellow Camellia. (5) Phylogenetic analysis of the chloroplast 
genomes of published species of Sect. Chrysantha revealed that C. minima was most closely 
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related to C. micrantha. This study provides crucial insights for exploring species evolution and 


enhancing exogenous gene expression, establishing a theoretical foundation for the conservation 


and utilization of species of Sect. Chrysantha in the 


future. 
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金 花 茶 组 (Sect. Chrysantha ) 隶 属于 山茶 科 (Theaceae) 山 茶 属 (Camellia L)， 主 要 分 布 在 我 


国 的 广西 、 云 南 以 及 越南 部 分 地 区 ( 赛 歼 ，2018) 


o HA 


长 环境 为 人 类 活动 踪迹 较 少 的 喀斯特 


地 貌 和 潮湿 山地 等 ( 李 桂 娥 等 ， 2022)。 所 有 人 金 花茶 组 植物 都 被 列 入 我 国 国家 重点 保护 野生 植 


品 ( 刘 青 等 ，2021) 。 金 花茶 植物 由 于 频繁 的 


片段 较 小 的 叶绿体 基因 组 的 SSC 区 ， 更 多 完整 的 叶绿体 基因 组 数据 的 积累 


保护 与 综合 利用 提供 基础 理论 支持 。 


属 植物 的 系统 发 育 和 网 状 进 化 关系 的 研究 提供 更 多 的 分 子 证 据 ， 也 可 以 为 


表明 网 状 进 化 是 造 


物 名 录 ， 保 护 等 级 为 二 级 (国家 林业 和 草原 局 ，2021)。 金 花茶 组 植物 被 称 为 “植物 界 的 大 能 
猎 ”、“ 共 中 皇后 ”， 因 为 该 组 植物 是 山茶 属 唯 
吴 丽 君 等 ，2020)。 金 花茶 组 植物 的 花 闪 和 叶片 中 含有 丰富 的 黄酮 ， 常 被 
! 间 杂交 和 多 倍 化 导致 其 分 类 研究 十 分 困难 
(Zhang et al., 2019)。Wei 等 (2022) 基 于 双 酶 切 位 点 相关 的 简化 基因 组 测序 (ddRAD)、 转 录 组 
和 核糖 体内 部 转录 间隔 区 CrITS) 等 数据 对 20 个 中 国 金 花茶 物种 进行 系统 发 育 重建 ， 结 合 形 
态 学 证 据 确 定 了 物种 之 间 的 亲缘 关系 。 研 究 表 明 ， 强 烈 的 杂交 /渗入 信号 
成 核 基 因数 据 和 叶绿体 基因 组 数据 构建 的 系统 发 育 树 不 一 致 的 主要 原因 。 


拥有 金黄 色 花 辩 的 类 群 ( 张 一 等 ，2018， 


j 作 保健 食品 与 饮 


该 研究 仅 采 用 了 
将 为 今后 金 花 茶 
金 花茶 组 植物 的 


四 分 体 结构 是 叶绿体 基因 组 的 典型 特征 ,由 一 个 大 单 拷贝 large single-copy, LSC) 区 、 一 
个 小 单 拷贝 (mall single-copy, SSC) 区 和 两 个 倒置 重复 序列 (inverted repeat, 


110-130 个 基因 ， 大 小 范围 为 120~180 kb(Li et al., 2021)。 相 较 于 核 基因 组 


在 基因 结构 、 基 因 内 容 、 基 因 序 列 方面 更 加 稳定 ， 较 慢 的 进化 速率 ， 因 此 


关系 等 研究 中 (Dong et al., 2018)。 近 年 来 叶 
绿 体 基 因 组 测序 的 成 本 大 大 降低 ， 越 来 越 多 的 叶绿体 基因 组 数据 被 成 功 应 


统 发 育 、DNA 条 形 码 、 基 因 工 程 和 种 群 间 亲缘 


育 和 进化 研究 。 同 时 叶绿体 基因 组 中 包含 大 量 包 


重复 序列 是 研究 物种 进化 


征 的 重要 依据 (Hui et al., 2014), 其 中 简单 重复 序 


列 (SSRs) 又 称 微 卫星 序列 可 


子 标记 来 检测 种 群 多 态 性 ， 广 泛 应 用 于 分 子 辅 且 


密码 子 是 连接 核酸 和 蛋白质 的 纽带 ， 在 遗传 信 


2012)。 研 究 物种 密码 子 使 用 模式 并 确定 最 优 密码 子 ， 这 有 助 了 
的 基因 的 表达 量 ， 在 品种 改良 方面 具有 重要 应 用 价值 (Qi etal., 


行 了 叶绿体 全 基因 组 测序 组 装 并 探讨 了 以 下 科学 问题 ; (1) 表征 了 越南 小 花 金 花茶 叶绿体 基 
办 组 图 谱 和 序列 特征 ; (2) 分 析 了 越南 小 花 金 花茶 叶绿体 基因 组 密码 子 使 用 的 偏好 性 并 推 
测 影响 密码 子 使 用 模式 主导 因素 ，(3) 探 究 了 越南 小 花 金 花茶 与 其 


IRs) 显 示 和 编码 
， 叶 绿 体 基因 组 


被 广泛 应 用 于 系 


用 于 植物 系统 发 
进程 以 及 遗传 特 
以 作为 有 效 的 分 


育种 和 物种 保护 等 方面 (Cavalier, 2002). 
息 的 传递 过 程 中 起 着 重要 的 作用 (Liu et al., 
设计 基因 表达 载体 来 提高 
2015， 胡 晓 艳 等 ，2019)。 


越南 小 花 金 花茶 (C. minima) 为 金 花茶 组 植物 之 一 ， 可 做 观赏 植物 和 嫁接 砧木 (George & 
Anthony, 201$)。 目 前 尚未 有 关于 越南 小 花 金 花茶 叶绿体 基因 组 的 相关 研究 ， 这 限制 了 对 其 
遗传 特征 和 系统 发 育 关系 的 理解 。 为 此 ， 本 研究 利用 高 通 量 测序 技术 对 越 


南小 花 金 花茶 进 


区 域 碱 基 分 布 的 差异 ，(4) 明 确 了 越南 小 花 金 花茶 在 金 花茶 组 植物 系统 发 育 


近 缘 物种 在 IR 和 SC 边界 


BM. AE 


究 不 仅 为 后 续 开 展 越南 小 花 金 花茶 物种 鉴定 、 遗 传 多 样 性 分 析 、 叶 绿 体 基 
育种 等 研究 提供 了 重要 的 理论 基础 ， 同 时 也 为 金 花茶 组 植物 的 系统 发 育 看 


的 叶绿体 基因 组 数据 。 


因 工程 以 及 分 子 


究 提供 了 更 丰富 


1 材料 和 方法 
1.1 植物 材料 
越南 小 花 金 花茶 采集 于 中 国 广西 壮族 自治 区 南宁 市 金 花茶 公园 (108°21’43"E 、 
22°49'30" N)， 采 集 单 株 新 鲜 幼 嫩 的 叶片 ， 然 后 装 进 有 硅胶 的 自封 袋 内 低温 保存 ， 用 于 后 续 
提取 总 DNA, 标本 保存 在 广西 壮族 自治 区 中 国 科 学 院 广 西 植物 研究 所 标本 馆 , 标本 凭证 为 : 
(CSF2020003)。 
1.2 DNA 提取 和 测序 

使 用 改良 的 CTAB 法 从 越南 小 花 金 花茶 干燥 的 叶片 中 提取 总 DNA， 叶 绿 体 基因 组 测序 
服务 由 北京 格致 博雅 生物 科技 有 限 公 司 提供 。 使 用 fastp 软件 处 理 测序 获得 的 原始 数据 ， 除 
去 过 多 的 N 序列 、 接 头 序列 和 过 短 序列 ， 输 出 大 小 为 1 005.18Mb 的 clean data， 用 于 后 续 的 
叶绿体 基因 组 组 装 (Gu et al., 2018). 
1.3 基因 组 组 装 注释 和 序列 表征 

使 用 getOrganelle v1.7.6.1 组 装 clean data, 参考 数据 库 为 em bplant_pt( 陆 生 植 物 叶绿体 )， 
最 大 扩充 循环 数 为 20， 调 用 Spedas 的 K-mer 值 为 21, 45, 65, 85, 105, 127; 拼接 完成 后 用 
Bandage 软件 可 视 化 (Jian et al., 2018)。 使 用 叶绿体 基因 组 在 线 注 释 网 站 CPGAVAS2 
(http://47.96.249.172:16019/analyzer/home)， 以 C. parvipetala (NC_067089.1) 为 参照 基因 组 进 
行 注释 。 使 用 GB2sequin 检查 序列 分 区 是 否 存 在 颠倒 并 手动 调整 准确 位 置 ， 得 到 完整 的 注 
Ft 结果 (Shi et al, 2019, Pascal & Stephan, 2018) 。 最 后 使 用 在 线 网 站 CPGview 
(http://www.1kmpg.cn/cpgview/) 绘 制 了 叶绿体 基因 组 圈 图 (Liu et al., 2023)。 注 释 完 成 的 叶 绿 
体 基 因 组 提交 至 GenBank 数据 库 ， 登 录 号 为 NC_069310.1， 相 应 的 SRA, BioProject 和 
BioSample 编号 分 别 为 SRR20648317、PRJNA861872 和 SAMN29930849. 
1.4 密码 子 使 用 偏好 性 分 析 
1.4.1 密码 子 相关 参数 计算 
在 剔除 重复 基因 、 含 有 终止 密码 子 和 长 度 小 于 300 bp 的 编码 序列 (Coding sequence, 
CDS) 后 , 选取 52 条 CDS 序列 进行 密码 子 分 析 。 使 用 Codon W 1.4.2 软件 对 相对 同 义 密码 子 
使 用 度 (Relative synonymous codon usage, RSCU) 进 行 分 析 。 利 用 EMBOSS 工具 包 中 的 CUSP 
程序 分 析 总 GC 含量 以 及 第 1、 第 2 和 第 3 个 碱 基 位 置 (GC1、GC2、GC3) 的 GC 含量 , CHIPS 
程序 用 于 分 析 有 效 密码 子 数 (ENC)( 朱 伟 才 等，2022)。 最 后 采用 R 软件 中 的 cor0 函 数 计算 相 
关 性 。 
1.4.2 密码 子 中 性 绘图 、ENc-plot 及 PR2-plot 绘图 
在 中 性 绘图 分 析 中 ， 以 GC12 和 GC3 做 散 点 图 ， 研 究 密码 子 3 个 位 置 碱 基 之 间 的 相关 
性 ， 从 而 分 析 突 变 压 力 和 自然 选择 对 于 密码 子 偏好 性 的 影响 (Wei et al., 2014). GCI2 为 GC1 
和 GC2 的 平均 值 。 如 果 GC12 和 GC3 之 间 显 著 相 关 ， 即 R? 越 大 且 趋 于 1 时 ，GC12 与 GC3 
的 相关 程度 越 高 ， 说 明 突 变 压 力 是 密码 子 使 用 偏向 的 决定 因素 。 相 反 ， 如 果 相 关 性 不 显著 ， 
则 回归 曲线 斜率 斜率 偏 低 甚至 接近 于 零 ， 表 明 密 码 子 偏好 性 由 自然 选择 主导 (Sueoka, 1988). 
ENC-plot 绘图 进一步 分 析 了 密码 子 偏好 性 受 碱 基 组 成 对 的 影响 ， 以 GC 为 横 坐 标 、 有 
效 密码 子 数 (ENC ) 为 纵 坐 标 进 行 绘制 散 点 图 ， 根 据 下 式 计 算 : ENC =2+ 
GC3+29/[GC3(1-GC3)?] ( 杨 祥 燕 等 ，2021， 辛 雅 营 等 ，2021)。 当 密码 子 偏好 性 仅 受 突变 影 
响 时 ， 基 因 将 沿 着 或 接近 标准 曲线 分 布 ， 而 当 基 因 落 在 标准 曲线 以 下 时 则 说 明 自 然 选择 等 
因素 是 影响 密码 子 偏好 性 的 主要 因素 (Chakraborty et al., 2020). 

奇偶 偏好 性 分 析 (Parity rule 2 plot, PR2-plot) 用 于 计算 各 密码 子 第 3 位 A、T、C、G 的 含 
量 , 通 常用 于 估计 突变 压力 和 自然 选择 对 密码 子 偏 好 性 的 影响 (Xiang et al., 2015) L A3 /( A3 

+ T3) 为 7 轴 ，G3 (G3 + C3) 为 x 轴 绘 制 PR2-plot Él. 中心 点 (A = T,G = 意味 着 自然 


选择 和 突变 压力 之 间 没 有 偏差 。 如 果 基 因 均 匀 分 布 在 中 心 点 周围 ， 则 认为 密码 子 偏好 性 可 
能 完全 是 由 突变 压力 造成 的 ， 否 则 ， 密 码 子 的 使 用 可 能 受到 自然 选择 和 其 他 因素 的 影响 
(Xiang et al., 2015). 

1.5 重复 序列 分 析 


使 用 在 线 网 站 REPuter 对 散在 重复 序列 进行 了 计生 
=200; 最 小 重复 序列 >30 bp; 重复 序列 相似 度 >90%; 


et al., 2001)。 简 单 重复 序列 使 用 在 线 网 站 MISA 进行 鉴定 和 统计 分 析 。 


。 参 数 设置 为 : 最 大 计算 重复 次 数 
汉 明 距离 (Hamming Distance)= 3 (Kurtz 
各 重复 单元 (unit size) 


对 应 的 的 最 少 重复 次 数 分 别 为 :1 一 10、2~~5、3~~4、4~~3、5~~3、6~~3， 相 邻 SSR 之 间 的 
最 小 单位 间隔 距离 设置 为 100 bp (Beier et al., 2017). 


1.6 叶绿体 基因 组 IR 边界 分 析 


基于 系统 发 育 


分 析 的 结果 ， 


地 部 署 的 IRscope 对 越南 小 花 金 花茶 及 其 
(Amiryousefi et al., 2018). 


行 可 视 化 分 析 
1.7 系统 发 育 分 析 


将 测序 组 
的 叶绿体 基 


质量 区 域 


F, 
et al., 2021). 


人 
2.1 叶绿体 基因 组 特征 


LSC 区 为 35.33%，SSC 


合作 用 有 关 的 基 
(ndhB, rpl2, rpl23, 


越南 小 花 金 花茶 叶绿体 基因 
有 两 个 长 度 为 26 047 bp 的 反 向 重复 (IR) 
一 个 18267 bp 的 小 单 拷贝 ( SSC ) 
区 为 30.6096, IR 
i ud 136 个 功 
因 有 45 个 ， Kuss 未 知 的 基 
rps], rpsl2, rrn4.SS, rrnSS, rrnl6S, rrn23S, trnl-CAU, trnL-CAA, 
trnN-GUU, trnR-ACG, trnV-GAC, ycf2, ycf15), 2 个 四 拷贝 基因 


越南 小 花 金 花茶 叶绿体 基 
41 个 tRNA 基因 和 8 个 rRNA 基 


确 性 。 


近 缘 物 


使 用 MAFFT(version 7.505) 进 行 多 序列 比 对 ， 使 
， 以 提高 比 对 结果 的 质量 和 准 


小 花 金 


rpll6, rpl12, atpF, rpoC1, 


花茶 的 叶绿体 基因 


组 中 
clpP, ndhB, ndhA, 
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图 1 越南 小 花 金 花茶 的 叶绿体 基因 组 圈 图 


Fig.1 Chloroplast genome physical map of Camellia minima 


LETI 


R1 越南 小 花 金 花茶 叶绿体 基因 组 的 注释 基因 信息 


Table 1 Annotated gene information of Camellia minima chloroplast genome 


功能 家 族 基因 名 称 
Function Family name Gene name 
自我 复制 核糖 体 小 亚 基 rps2, rps3 , rps4, rps8, rps11, rps14, 
self-replication Ribosomal proteins (SSU) rps15, rps16, rpsl8, rps19, rps7*, rps12* 
核糖 体 RNA rrn4.58*, rrn5S*, rrnl6S*, rrn238* 
rRNA 
核糖 体 大 亚 基 rpl14, rpl16, rpl20, rpl22, rpl32, rpl33, 
Ribosomal proteins (LSU) rpl36, rpI2*, , rpl23* 
DNA 依赖 性 RNA 聚合 酶 rpoA, rpoB, rpoCl, rpoC2 
DNA-dependent RNA 
polymerase 
转运 RNA trnC-GCA, trnD-GUC, trnE-UUC, trnF-GAA, 
tRNA trnfM-CAU, trnG-GCC, trnG-UCC, trnH-GUG, 


trnK-UUU, trnL-UAA, trnL-UAG, trnM-CAU, 
trnP-UGG, trnQ-UUG, trnR-UCU, trnS-GCU, 
trnS-GGA, trnS-UGA, trnT-GGU, trnT-UGU, 
trnV-UAC, trnW-CCA, trnY-GUA, trnR-ACG*, 
trnL-CAA*, trnV-GAC'*, trnN-GUU*, trnI-CAU*, 
rnA-UGC**, trnl-GAU**, 


光合 作用 ATP 合 酶 亚 基 atpA, atpB, atpE, atpF, atpH, atpI 
Photosynthesis ATP synthase subunit 


NADH 一 脱氧 酶 的 亚 基 
NADH-dehydrogenase 


subunits 


细胞 色素 bf 复合 物 的 亚 基 
Subunits of cytochrome b / f 


complex 


HRR T B NE dE 


Subunits of photosystem I 


HRA TTL BENE 
Subunits of photosystem II 


二 磷酸 核 酮 糖 氧 合 酶 


其 他 假定 叶绿体 阅读 框 
other Hypothetical chloroplast 


reading frames (ycf) 


乙酰 一 CoA 一 羧 化 酶 的 亚 基 


Subunits of 


acetyl-CoA-carboxylase 


包 膜 蛋白 基因 


Envelope protein gene 


c 型 细胞 色素 合成 基 医 
Type c cytochrome Synthesis 


gene 


蛋白 酶 基因 


Protease gene 


成 熟 酶 基因 


Mature enzyme gene 


转录 起 始 因子 


Transcription initiation factor 


ndhA, ndhC, ndhD, ndhE, ndhF, ndhG, ndhH, ndhl, 
ndhJ, ndhK, ndhB* 


petA, petB, petD, petG, petL, petN 


psaA, psaB, psaC, psal, psaJ 


psbA, psbB, psbC, psbD, psbE, psbF, psbH, psbl, 


psbJ, psbK, psbL, psbM, psbN, psbT, psbZ 


rbcL 


yef1l, ycf3, ycfa, ycf15*, ycf2* 


accD 


cemA 


ccsA 


clpP 


matK 


infA 


È: * 表 示 存 在 一 个 内 含 子 ;表示 存在 两 个 内 含 子 。 


Note:* indicates the presence of one intron; ** indicates the presence of two introns. 


2.2 重复 序列 分 析 


通过 MISA 在 线 网 站 分 析 ， 发 现 越南 小 花 金 花茶 的 叶绿体 基因 组 中 含有 的 SSR 位 点 数 
目 为 66 个 ， 类 型 包括 单 核 苷 酸 、 二 核 昔 酸 、 三 核 苷 酸 、 四 核 背 酸 和 六 核 苷 酸 ， 且 大 多 数 为 
单 核 昔 酸 重复 (图 2: C)。 这 些 类 型 的 SSR 有 17 个 分 布 在 蛋白 编码 区 、40 个 分 布 在 基因 间 
隔 区 、9 个 分 布 在 内 含 子 区 (图 2: B) 。 通 过 REPuter 软件 分 析 了 越南 小 花 金 花茶 叶绿体 
基因 组 中 的 散在 重复 序列 , 共 检 测 到 39 个 散在 重复 序列 , 分别 是 16 个 正 向 重复 序列 (forword) 
和 23 个 回 文 重复 序列 (palindromic)， 但 没有 检测 到 反 向 (reverse) 和 互补 (complement) 重 复 序 
列 的 存在 。 这 些 散 在 重复 序列 的 长 度 在 30-64 bp 之 间 ， 且 大 部 分 位 于 IR 区 的 ycf2 基因 中 
(图 2: D). 
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A. SSR 的 类 型 与 数量 ，B. LSC、SSC 和 IR 区 域 的 蛋白 编码 区 、 基 因 间 的 间隔 区 和 内 含 子 中 SSR 的 数量 ; 


C. 不 同类 型 SSR 的 占 比 ，D. 散在 重复 序列 类 型 与 数量 。 
A. Type and number of SSRs; B. Presence of SSRs in the proteincoding regions, intergenic spaces (IGSs) and 


introns of LSC, SSC and IR regions; C. Proportion of different types of SSRs; D. Type and number of long 
repeats. 
图 2 越南 小 花 金 花茶 叶绿体 基因 组 的 重复 序列 分 布 
Fig. 2 Distribution of of different types of SSRs 

2.3 密码 子 偏好 性 分 析 
2.3.1 同 义 密码 子 相对 使 用 度 分 析 

对 越南 小 花 金 花茶 叶绿体 基因 组 的 52 个 大 于 300 bp 的 蛋白 质 编码 序列 进行 密码 子 偏 
好 性 分 析 发 现 ， 其 中 相对 同 义 密码 子 使 用 度 (RSCU) 值 大 于 1 的 密码 子 有 30 个 ， 其 中 13 个 
以 A(30 中 13) 或 U(30 中 16) 结 尾 ， 以 G 结尾 的 数目 仅 有 1 个; RSCU 值 小 于 1 的 32 个 密 
码 子 多 以 C (32 个 中 16 个 ) 或 G(32 中 13) 结 尾 ,表明 密码 子 偏 好 使 用 以 A/U 结尾 的 密码 子 
(图 3)。 
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图 中 不 同 的 颜色 表示 RSCU 值 的 大 小 ， 随 着 颜色 变 深 密 码 子 使 用 率 增加 。 


Different colors in the figure represent the size of the RSCU value. As the color darkens, the codon usage rate 


increases. 


图 3 越南 小 花 金 花茶 的 RSCU 值 热 图 
Fig. 3 RSCU heat map of Camellia minima 


2.3.2 密码 子 中 性 绘图 、ENc-plot  PR2-plot 分 析 

对 越南 小 花 金 花茶 叶绿体 基因 进行 中 性 图 ( GC12 vs GC3) 分 析 ( 图 4: A)。 结 果 显 示 叶 绿 
体 基因 分 布 相对 集中 , 但 并 不 密集 。GC12 和 GC3 的 平均 值 分 别 为 43.10% 和 27.49%。GC12 
和 GC3 的 相关 系数 为 一 0.118(R2=0.014)， 回 归 曲 线 斜 率 为 0.107， 表 明 GC12 与 GC3 无 显 
著 相 关 性 。 由 此 推断 密码 子 使 用 偏好 性 受 突 变 压 力 影响 较 小 ， 而 自然 选择 等 因素 的 贡献 更 
Xe 


为 了 评估 越南 金 花茶 叶绿体 基因 组 中 蛋白 编码 基因 的 密码 子 偏好 程度 ， 计 算 并 分 析 了 
ENC 值 。 如 图 4B 所 示 ， 大 部 分 基因 的 ENC 值 低 于 预期 值 ， 位 于 标准 曲线 下 方 ， 表 明 密 码 
子 使 用 偏好 性 主要 受 自然 选择 等 因素 的 影响 ， 而 突变 压力 仅 起 次 要 作用 。 为 了 进一步 反映 
差异 ， 分 析 了 越南 小 花 金 花茶 叶绿体 基因 的 ENC 频率 分 布 ( 表 2)。ENC 比值 在 -0.05~0.45 之 
IR], 其 中 9 个 (17.00% ) 基 因 分 布 在 -0.05~0.05 范围 内 , 表明 这 部 分 基因 分 布 在 标准 曲线 周围 ， 
而 剩余 的 大 部 分 基因 都 距离 标准 曲线 较 远 ， 以 上 结果 说 明了 自然 选择 对 越南 小 花 金 花茶 叶 
绿 体 基因 组 密码 子 偏好 的 影响 更 大 。 

如 果 密 码 子 偏 好 性 完全 受 突变 影响 ， 则 密码 子 第 3 位 核 背 酸 A、T、C、G 的 使 用 频率 
相同 。 在 本 研究 中 ，PR2 平面 的 4 个 区 域 并 不 是 均匀 分 布 的 (图 4: C)。 大 部 分 基因 位 于 平 
面 的 下 半 部 分 ， 尤 其 是 右 下 方 。 因 此 ， 从 碱 基 的 使 用 频率 来 看 ，T>A，G>C， 表 明 叶 绿 体 基 
因 组 中 A/T 和 G/C 的 密码 子 使 用 偏好 性 不 平衡 ， 推 断 越 南小 花 金 花茶 叶绿体 基因 组 的 密码 
子 偏好 性 同时 受到 突变 压力 和 自然 选择 等 因素 的 影响 。 


GC12 


G3/(G3 + C3) 


A. 中 性 绘图 分 析 ，B. ENC-GC3 关联 分 析 ; C. PR2-plot 关联 分 析 。 
A. Neutrality plot analysis; B. Analysis on ENC and GC3 relationship; C. Analysis on PR2-plot relationship. 
图 4 越南 小 花 金 花茶 叶绿体 基因 的 进化 因素 分 析 
Fig. 4 Analysis of evolutionary forces of chloroplast genes in Camellia minima 


表 2 ENC 比值 频数 分 布 
Table 2 Distribution of ENC ratio 


组 限 中 值 频数 频率 
Class boundary Class mid value Number Frequency 
-0.05~0.05 0 9 0.17 
0.05~0.15 0.1 30 0.58 
0.15~0.25 0.2 10 0.19 
0.25~0.35 0.3 2 0.04 
0.35~0.45 0.4 1 0.02 

2.4 IR 边界 分 析 


叶绿体 基因 组 在 LSC、IRb、IRa 和 SSC 之 间 有 四 个 边界 : LSC/IRb 边界 ，IRb/SSC 边 
界 ，SSC/IRa 边界 和 IRa/LSC 边界 。 本 研究 对 越南 小 花 金 花茶 及 6 个 近 缘 金 花茶 组 植物 的 叶 
绿 体 基 因 组 边界 进行 了 比较 分 析 ( 图 5)。 结 果 表明 ， 在 所 有 比较 的 叶绿体 基因 组 中 ，IR 区 仅 
有 轻微 的 扩张 和 收缩 ， 长 度 从 25996 ”bp( 四 季 花 金 花茶 ) 到 26 096 ”bp( 毛 办 金 花 茶 )。 在 
LSC/IRb 边界 处 ,所 有 物种 的 rps19 基因 都 跨越 了 LSC/IRb 边界 ,向 IRb 区 域 延 伸 了 46 bpo 
在 IRb/SSC 边界 处 ，7 个 金 花茶 组 植物 的 边界 均 位 于 ycfl 假 基 因 和 ndhF 基因 的 重 登 处 ， 在 
越南 金 花茶 和 毛 注 金 花茶 中 ，ndhF 基因 跨越 IRb/SSC 边界 ， 分 别 有 39、25 bp 位 于 IRb 区 
域 中 。 在 SSC/IRa 边界 处 ，ycfl 基因 跨越 该 边界 ， 包 含 在 Ra 区 域内 1034-1055 bp。 在 
IRa/LSC 边界 处 ,所 有 物种 的 边界 均 位 于 rps19 拷贝 基因 和 trnH 基因 之 间 ,trnH 距离 IRa/LSC 
边界 1 bp。 
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dS EK Camellia fascicularis 
156815bp 


越南 金 花茶 C insularis 
156882bp 


越南 金 花 某 C. micratha 
156958 bp 


越南 小 花 金 花茶 C. minima 
156961bp 


四 季 花 金 花茶 C. perpetua 
156804 bp 


平 果 金 花茶 C. pingguoensis 
156621 bp 


TEMERE C pubipetala 
156993 bp 


5 来 自 7 种 金 花茶 组 植物 的 叶绿体 基因 组 IR 区 域 的 边界 分 析 
Fig. 5 Boundary analysis of IR regions of chloroplast genomes from seven yellow camellia 
species 

2.5 系统 发 育 分 析 

基于 25 种 山茶 科 植 物 (包括 24 种 金 花茶 组 植物 和 1 种 大 头 茶 属 物种 ) 叶 绿 体 全 基因 组 序 
列 构 建 系统 发 育 树 ， 以 P. penangensis 作为 外 类 群 ， 利 用 最 大 似 然 法 构建 系统 发 育 树 。 结 果 
表明 24 种 金 花茶 组 植物 主要 分 为 2 个 分 支 Cladel 分 支 和 Cladell 分 支 。CladeI 分 支 中 ， 越 
南小 花 金 花茶 (C. minima) 与 小 花 金 花茶 (C. micrantha) UA 100% 的 支持 率 聚 为 了 一 个 单 支 ， 表 
明 这 两 个 物种 的 亲缘 关系 最 近 ( 图 6)。 
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Camellia micrantha NC 058646 (小 花 金 花 茶 ) 
Camellia minima OP271826 (越南 小 花 金 花茶 ) 
C insularis OP271825 (越南 金 花茶 ) 
C fascicularis NC 053896 ( 簇 蕊 金 花 茶 ) 
C perpetua NC 054364 (四季 人 金 花茶 ) 
C pubipetala NC 054365 ( 毛 辩 金 花茶 ) 
C debaoensis NC 057958 ”( 德 保 金 花茶 ) 
C liberofilamenta NC 061603 (贵州 金 花茶 ) 
C xiashiensis NC 061602 ( 夏 石 金 花茶 ) CladeI 
C nitidissima var nitidissima MT157617 (4z162K) 
C euphlebia OL405564 ( 显 脉 金 花茶 ) 


C pingguoensis NC 061051 ( 平 果 金 花茶 ) 
z C indochinensis var tunghinensis NC 067091 (东兴 人 金 花 茶 ) 
T [————— C parvipetala NC 067089 (小 辩 金 花茶 ) 
5 C wumingensis NC 067092 ( 武 鸣 金 花茶 ) 


C ptilosperma NC 067090 ( 毛 籽 金 花茶 ) 
C sp longruiensis OL685018 
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95 C lungzhouensis MN579509 (EMI 4 1E2K) 
-二 — C petelotii var microcarpa NC 061600 

C flavida NC 068780 ”( 淡 黄金 花茶 ) 
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C achrysantha NC 057956 (小 果 金 花茶 ) Clade II 
C limonia NC 061599 (柠檬 金 花茶 ) 

C aurea NC 062050 (五 室 金 花茶 ) 

C tamdaoensis OP066526 (三 岛 金 花茶 ) 

Polyspora penangensis NC 059950 
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支 上 的 数字 为 1 000 次 自 展 支持 率 (%)。 
The 1 000 bootstrap value (%) was shown above the branch. 


图 6 基于 25 个 叶绿体 全 基因 组 的 系统 发 育 树 


Fig. 6 Phylogenetic tree based on 25 complete chloroplast genomes 


3 讨论 与 结论 


金 花茶 组 植物 均 为 国家 二 级 保护 植物 (国家 林业 和 草原 局 ，2021)， 具 有 较 高 的 观赏 和 药 
用 价值 。 其 中 越南 小 花 金 花茶 是 一 种 原 产 于 越南 北部 的 金 花 茶 组 植物 ， 生 长 于 潮湿 荫蔽 的 
山谷 。 由 于 其 拥有 较 强 的 适应 能 力 ， 被 视 为 优良 的 嫁接 砧木 ， 近 年 来 受到 了 园艺 界 的 广泛 
关注 ( 李 桂 娥 等 ，2022)。 越 南小 花 金 花茶 叶绿体 基因 组 为 典型 的 环 状 双 链 四 分 体 结构 、 长 度 
为 156961 bp. GC 含量 为 37.32%， 叶 绿 体 全 基因 组 注释 到 了 136 个 基因 ， 包 括 87 个 蛋 
编码 基因 ，41 个 转运 RNA 基因 和 8 个 核糖 体 RNA 基因 , 共有 10 个 基因 含有 内 含 子 ， 其 
rpl12 和 ndhB 基因 含有 2 个 内 含 子 ， 这 与 金 花 茶 组 其 他 植物 的 特征 一 致 ， 可 能 与 叶绿体 
基因 组 的 特殊 结构 和 复制 方式 有 关 (Henry et al., 2016; Wu et al., 2021)。 此 外 ， 越 南小 花 金 花 
茶 的 叶绿体 基因 组 长 度 、 基 因 的 类 型 和 排列 顺序 、GC 含量 等 与 山茶 属 的 其 他 已 发 表 物种 ( 例 
如 山茶 、 油茶 、 思 脉 金 花茶 等 ) 相似 。 这 表明 越南 小 花 金 花茶 叶绿体 基因 组 的 进化 可 能 是 保 
守 而 缓慢 的 ( 杆 祥 青 等 ，2022; Sophiarani et al., 2019)。 

简单 序列 重复 序列 (SSRs) 是 由 DNA 链 的 滑 移 产生 的 , 在 基因 组 和 叶绿体 基因 组 中 都 有 较 
广 分 布 。 与 其 他 中 性 DNA 区 域 相 比 ，SSRs 通常 具有 更 高 的 突变 率 。 由 于 其 具有 非 重组 、 单 
倍 体 和 单 杀 遗 传 的 特性 ， 因 此 常 被 用 作 遗 传 标 记 ， 为 植物 群体 遗传 学 和 生态 学 及 进化 研究 
提供 有 价值 的 信息 (Gui et al, 2020, Aii et al., 1997)。 该 研究 在 越南 小 花 金 花茶 叶绿体 基因 组 
鉴定 了 66 个 SSR 位 点 ， 主 要 位 于 大 单 找 贝 区 (LSC)， 其 中 所 有 的 单 核 背 酸 重复 都 是 由 
A/T 组 成 ， 类 似 的 结果 在 金 花茶 组 叶绿体 基因 组 ( 丁 祥 青 等 ，2022) 和 其 他 被 子 植 物 中 均 有 发 
现 (Yang et al., 2014; Hui et al, 2014), 这 可 能 归 因 于 polyA 和 polyT 相 比 polyC 和 polyG 具有 
更 高 的 结构 稳定 性 (Jin et al., 2023)。 然 而 ， 我 们 检测 到 的 SSR 位 点 数量 与 Hui 等 (2014) 的 结 
果 存 在 差异 ， 这 可 能 是 由 于 检索 SSR 位 点 的 参数 设 定 不 同 ， 导 致 输出 的 结果 不 同 。 在 越南 
小 花 金 花茶 的 叶绿体 基因 组 中 ，cp-SSRs 含量 丰富 ， 可 用 于 检测 群体 的 遗传 多 态 性 。 此 外 ， 
在 越南 小 花 金 花茶 叶绿体 基因 组 中 鉴定 出 的 散在 重复 序列 主要 以 正 向 和 回 文 重 复 为 主 ， 这 
与 抱 茎 金 花 茶叶 绿 体 基因 组 序列 特征 类 似 ( 丁 祥 青 等 ，2022)。 这 些 重复 序列 是 重要 的 遗传 资 
源 ， 在 系统 发 育 研究 中 发 挥 着 重要 作用 (Wei et al., 2022)。 

密码 子 使 用 偏好 性 对 于 研究 基因 的 分 子 进化 和 外 源 表达 具有 重要 意义 (Li et al., 2021)。 
本 研究 首次 系统 分 析 了 越南 小 花 金 花茶 叶绿体 基因 组 的 密码 子 使 用 模式 , 发 现 精 氨 酸 (Arg)、 
异 亮 氨 酸 (Leu)、 甘 氨 酸 (Ser) 是 密码 子 编码 的 最 丰富 的 氨基 酸 ， 由 六 个 密码 子 编码 ， 相 比 之 
下 ， 色 和 氨 酸 (Trp)、 甲 硫 氨 酸 (Met) 仅 有 一 个 密码 子 编码 ， 叶 绿 体 基因 倾向 于 使 用 A /U 密码 
子 ， 这 与 耿 晓 姗 等 2022) 对 金 花 茶 的 密码 子 分 析 研 究 结果 一 致 。 通 过 进行 中 性 绘图 分 析 ， 我 
们 发 现 GC12 和 GC3 之 间 之 间 没 有 显著 的 相关 性 ， 且 基因 分 布 相对 集中 ， 表 明 自 然 选 择 是 
影响 密码 子 偏好 的 主要 因素 (Zhang et al., 2012)。 进 一 步 结 合 ENC 绘图 、PR2-plot 分 析 结 果 ， 
表明 越南 小 花 金 花茶 的 密码 子 使 用 偏好 性 受 多 个 因素 影响 ， 包 括 突变 压力 、 碱 基 组 成 和 基 
因 长 度 , 其 中 自然 选择 是 主导 影响 因素 , 这 与 丁 祥 青 等 (2023) 的 分 析 结 果 一 致 ( 李 清 等 , 2022)。 
然 选 择 是 叶绿体 基因 组 进化 的 主要 驱动 力 ， 这 一 发 现 加 深 了 我 们 对 越南 小 花 金 花茶 进化 
历史 的 理解 ， 特 别 是 与 自然 选择 有 关 的 进化 历史 。 对 密码 子 偏好 性 的 分 析 结 果 有 利于 密码 
子 优化 ， 可 为 今后 金 花茶 组 植物 转基因 技术 提供 理论 依据 ( 段 义 忠和 张 遍 ，2020)。 
在 叶绿体 基因 组 中 ，IR 的 收缩 和 扩张 时 常 发 生 ， 这 些 差 异 会 导致 假 基因 的 产生 、 基 因 
重复 和 基因 缺失 ， 进 一 步 造 成 人民 / SC 连接 处 的 位 置 变化 ， 高 等 植物 叶绿体 基因 组 长 度 变 异 
就 是 由 这 种 位 置 变化 造成 的 (Li et al., 2021)。 本 研究 对 越南 小 花 金 花茶 及 6 个 近 缘 金 花茶 组 
植物 的 叶绿体 基因 组 边界 进行 比较 分 析 ， 结 果 表 明 7 个 物种 IR 区 长 度 (25 996 bp ~ 26 096 
bp) 基 本 一 致 , 未 检测 到 基因 丢失 ,这 表明 及 区 的 高 度 保守 可 能 对 于 维持 其 长 度 和 结构 稳定 
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至 关 重 要 。 通 过 边界 收缩 和 扩张 分 析 ， 发 现 了 yfl 基因 的 长 度 和 位 置 在 不 同 金 花茶 组 植物 
间 存 在 差异 ， 可 能 是 潜在 的 突变 热点 区 域 。 在 先前 的 研究 中 ,ycfl 基因 因 其 高 度 的 多 态 性 而 
被 推荐 作为 植物 的 核心 DNA. 条 形 码 ， 然 而 ， 这 一 潜在 的 高 变 区 是 否 可 以 作为 金 花茶 组 植物 
有 效 的 DNA 条 形 码 还 需要 进一步 的 验证 (Li etal., 2021) 。 此 外 ， 越 南小 花 金 花茶 及 6 个 
近 缘 金 花茶 组 植物 的 叶绿体 基因 组 边界 相对 保守 ， 表 明 其 亲缘 关系 较 近 ， 之 后 的 系统 发 育 
研究 也 支持 了 这 一 推论 。 

迄今 为 止 ， 许 多 学 者 已 经 采用 诸如 随机 扩 增 多 态 性 DNA (RAPD )、 叶 绿 体 DNA 
trnL-trnF、 扩 增 片 段 长 度 多 态 性 ( AFLP )、 简 单 重复 序列 间 区 ( ISSR ) 以 及 核糖 体内 转录 间隔 
区 (nrITS ) 等 多 样 化 的 分 子 标记 ， 以 阐明 山茶 属 之 间 的 亲缘 关系 (Ju etal., 2021)。 尽管 Wei 
等 (2022) 整合 了 ddRAD、 转 录 组 、nrITS 和 SSC 等 分 子 标记 研究 金 花茶 组 系统 发 育 关 系 ， 
但 基于 叶绿体 基因 组 SSC 区 的 系统 发 育 树 支 持 率 极 低 。 本 研究 基于 叶绿体 全 基因 组 序列 ， 
对 越南 小 花 金 花茶 和 其 余 23 种 金 花茶 组 植物 的 系统 发 育 关系 进行 了 分 析 ， 依 据 系统 发 育 的 
结果 可 将 系统 发 育 树 分 为 两 个 大 的 分 支 ， 其 中 越南 小 花 金 花茶 与 小 花 金 花茶 聚 为 高 支持 率 
的 分 支 ， 亲 缘 关 系 最 近 。 各 分 支 支持 率 较 高 ， 表 明 完整 的 叶绿体 基因 组 数据 可 为 重建 金 花 
茶 组 系统 发 育 关系 提供 重要 的 数据 支持 。 

综 上 所 述 ， 该 文 首次 完成 了 越南 小 花 金 花茶 叶绿体 基因 组 的 序列 测序 、 组 装 注释 和 基 
础 信息 分 析 ， 揭 示 了 越南 小 花 金 花茶 叶绿体 基因 组 基本 特征 。 在 此 基础 上 ， 通 过 齐 析 密码 
子 使 用 模式 以 及 影响 密码 子 偏好 的 各 类 因素 ， 确 定 了 越南 小 花 金 花茶 叶绿体 基因 组 的 高 频 
密码 子 ， 为 后 续 山 茶 属 金 花茶 组 植物 的 转基因 研究 提供 了 理论 支持 。 此 外 ， 基 于 全 叶绿体 
基因 组 构建 的 系统 发 育 树 明确 了 越南 小 花 金 花茶 在 金 花茶 组 植物 中 的 系统 位 置 。 本 研究 为 
后 续 越南 小 花 金 花茶 和 其 他 金 花 茶 组 植物 的 保护 和 合理 开发 利用 研究 提供 了 理论 基础 。 
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